Oficina 4

CE II: GitHub

Carolina Musso

COEA/DEPAT/IPE-DF

Luiz Oliveira

DEPAT/IPE-DF

Rafael de Acypreste

O Que é Reprodutibilidade na Ciência?

  • Reprodutibilidade/Replicabilidade é a capacidade de obter resultados consistentes utilizando o mesmo método de pesquisa em experimentos ou estudos separados.
  • É um pilar fundamental da ciência moderna, assegurando que descobertas possam ser verificadas e confiadas por outros pesquisadores.
  • Reprodutibilidade/Replicabilidade envolve:
    • Uso de métodos experimentais claros e bem documentados.
    • Disponibilidade de dados e códigos utilizados para análise.
    • Publicação transparente de resultados e processos

Entendendo a Crise de Reprodutibilidade

  • A Crise de Reprodutibilidade refere-se à dificuldade crescente em replicar ou reproduzir resultados de pesquisas científicas em várias disciplinas.
  • Causas da Crise:
    • Pressão para Publicar: Cultura de “publicar ou perecer” pode incentivar resultados rápidos em detrimento da qualidade.
    • Métodos Inadequados: Falta de detalhamento nos métodos experimentais que impede a reprodução precisa dos estudos.
    • Manipulação de Dados: Em casos extremos, dados podem ser selecionados ou manipulados para produzir resultados desejados.

Escândalo da reproducibilidade

  • Crise de repoducibilidade/replicabilidade

Introdução ao GitHub

  • O GitHub é uma plataforma baseada na nuvem onde você pode armazenar, compartilhar e colaborar com outros para escrever código.
  • Armazenar seu código em um “repositório” no GitHub permite:
    • Exibir ou compartilhar seu trabalho.
    • Acompanhar e gerenciar mudanças no seu código ao longo do tempo.
    • Permitir que outros revisem seu código e façam sugestões para melhorá-lo.
    • Colaborar em um projeto compartilhado, sem se preocupar que suas mudanças impactem o trabalho de seus colaboradores antes que você esteja pronto para integrá-las.
  • A colaboração é uma das características fundamentais do GitHub, possibilitada pelo software de código aberto, Git, que é a base do GitHub.
  • Existem alternativas, como GitLab e BitBucket. . . .

Sobre o Git

  • Git é um sistema de controle de versão que rastreia inteligentemente as mudanças nos arquivos.
  • É particularmente útil quando você e um grupo de pessoas estão fazendo mudanças nos mesmos arquivos ao mesmo tempo.
  • Em um fluxo de trabalho baseado no Git, você normalmente:
    • Cria uma ramificação a partir da cópia principal dos arquivos que você e seus colaboradores estão trabalhando.
    • Faz edições de forma independente e segura na sua própria ramificação pessoal.
    • Deixa o Git mesclar de forma inteligente suas mudanças de volta à cópia principal dos arquivos.

Como o Git e o GitHub Trabalham Juntos?

  • Ao fazer upload de arquivos para o GitHub, você os armazena em um “repositório Git”.
  • Há várias ações relacionadas ao Git que você pode completar diretamente no GitHub pelo seu navegador, como criar um repositório Git, criar ramificações, fazer upload e editar arquivos.
  • A maioria das pessoas trabalha com seus arquivos localmente (em seu próprio computador), sincronizando continuamente essas mudanças locais e todos os dados relacionados ao Git com o repositório remoto central no GitHub.

Primeiros Passos e Próximos Passos

  • Se você é novo no GitHub e não está familiarizado com o Git, recomenda-se começar pelos artigos na categoria “Comece sua jornada”.
  • Esses artigos focam em tarefas que você pode completar diretamente no seu navegador no GitHub e ajudarão você a:

Linguagens de Programação e Reprodutibilidade

  • Ferramenta Essencial para a análise de dados e visualização de grandes volumes de dados com precisão.
  • Reprodutibilidade e Automatização: Scripts permitem que análises sejam replicadas por outros pesquisadores.
  • Documentação e Transparência: Códigos bem documentados são cruciais para que outros verifiquem e entendam os métodos utilizados.

Outras vantagens do R (e do Python)

  • Gratuito e open source :

    • Vai conseguir usar sempre.
  • Um grande processo colaborativo:

    • O que você quiser fazer, alguém já tentou e vai te ajudar!
  • Não é uma “caixa preta”:

    • você aprende mais com os erros.
  • “Conversa” com outras linguagens e ambientes:

    • Latex, Markdown, html, python, Collab, GitHub, Overleaf…
  • REPRODUCIBILIDADE DAS SUAS ANÁLISES

    • Bom pra você e bom para a ciência!

Canais e Sites

Configurando o git no Rstudio

Baixe o git

  • Baixe o apropriado para seu computador.

  • Instale seguindo as recomendações padrão.

Comentários importantes

Você pode usar o Git por meio de:

  • Linha de comando : git terminal do RStudio

  • Interfaces gráficas: GitHub Desktop, Git Pane do RStudio.. .

Conectando o Github no RStudio

  • GitHub Caso já tenha, não é preciso criar uma nova conta.

  • Vamos aprender com quem sabe (mais!)

  • Beatriz Milz

Boas práticas

  • Caminho absoluto x Caminho relativo
  • Embed-resources x Enviar todas as dependencias
  • Trabalhar com projetos